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摘 要 : [目的 /意义 ] 以 故事 线 梳理 史实 脉络 ,不 仅 对 于 描绘 


与 把 握 历 史 发 展 方向 具有 一 定 的 理论 和 现实 指导 意义 ,同时 


也 为 人 文 领域 的 知识 发 现 提供 新 的 技术 实现 方式 和 创新 性 研究 视角 。[ 方 法 /过 程 ] 提 供 一 种 基于 文本 数据 的 故 
事 线 构建 及 可 视 化 、 情 感化 场景 化 的 研究 范式 ,通过 已 梳 《张学良 口述 历史 ) 文 本 作为 数据 源 进行 实证 探索 。 采 用 
jieba 分 词 对 《张学良 口述 历史 初始 数据 源 进行 数据 清洗 获取 实验 数据 源 ,应 用 LDA 主题 模型 获取 主题 分 布 并 进行 
t-SNE 数据 降 维 呈现 主题 模块 ,借助 SnowNLP 情感 词典 挖 握 情 感 特征 词 ,梳理 张学良 情感 演化 阶段 ,进行 故事 线 构 


™ 
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建 。[ 结果 /结论 ] 通过 构建 张学良 故事 线 ,实现 人 物 、 地 点 、 事件、 时 间 、 情 感 等 多 维 要 素 的 动态 互 促 。 


人 | 


引言 


CN 伴随 数字 人 文 迅猛 发 展 ,文本 处 理 和 图 像 分 析 能 
大 是 新 ,数据 类 型 和 规模 呈 指 数 增长 趋势 。 在 海量 数 
据 昼 前 ,用 户 不 再 固 于 数量 堆栈 ,也 不 再 满足 于 文本 内 
短文 本 关系 挖掘, 而 是 致力 于 提高 文本 数据 处 理 的 效 
率 和 深度 ,探寻 多 元 复杂 的 数据 规律 及 数据 问 潜藏 
的 轩 义 关系 ,快速 发 现 核心 内 容 和 潜在 知识 关联 。 
< 目前 ,有 关 历 史 文 化 的 研究 多 趋向 数字 化 及 数据 
构 年 ” , 鲜 从 故事 线 视角 探 咯 。 作 为 一 种 新 兴 叙 事 手 
段 ,故事 线 是 为 了 提升 数据 的 可 理解 性 可 记忆 性 及 可 
体验 性 ,将 “数据 "还 原 或 关联 至 特定 情景 ”, 基于 基 
础 时 间 线 隐喻 的 视觉 表达 ,以 事件 作为 记忆 的 存储 音 
元 ,能 直观 .交互 式 展现 数据 信息 ,深度 解读 数据 ,本 
质 是 以 “故事 叙述 "方式 呈现 * 从 数据 中 发 现 的 洞察 ”， 
可 以 还 原 情景 .移植 情景 和 虚构 情景 "。 
“ 数 智 "时 代 , 人 文学 者 面临 着 使 用 传统 手段 感知 
数据 的 技术 困境 和 进行 数据 交互 认 知 的 人 文 迷 思 , 区 
需 寻 求 兼 具 技术 与 人 文 框架 的 信息 交流 与 传播 工 
具 “”。 而 故事 线 上 同 显 了 人 文 关怀 与 数字 技术 的 交互 渗 


透 '" ,并 且 与 数字 人 文 多 元 化 .融合 化 .可 拓展 性 的 特 
征 深 度 契 合 , 对 于 人 文学 者 躲避 海量 低 价 值 密 度 信 息 
淹没 ,摆脱 数据 感知 与 交互 困境 具有 重要 的 工具 价值 ， 
成 为 数字 人 文 方法 论 甚至 技术 体系 的 重要 环节 "|。 
此 ,本 文 从 数字 人 文 视角 出 发 , 择 取 《张学良 口述 历 
史 》 文 本 为 数据 源 ,并 以 此 为 基点 构建 张学良 故事 线 ， 
不 拘泥 于 人 一 事 一 地 一 时 等 基础 关联 信息 的 呈现 ,还 
注入 了 情感 演化 时 期 ,使 故事 线 表现 形式 更 加 饱满 、 丰 
富 ,不 仅 突破 了 传统 知识 组 织 的 二 维 平面 空间 ,实现 了 
多 模 态 (可 视 化 .情感 化 与 场景 化 ) 知识 组 织 聚 合 、 知 
识 关 联 拓展 与 多 维 知识 耦合 ,而 且 对 于 描绘 .把 握 与 分 
析 历 史 人 物 发 展 走向 ,更 好 地 理解 .梳理 与 挖掘 要 素 具 
有 重要 启示 意义 。 同 时 ,也 为 人 文 领域 学 者 研究 提供 
了 一 种 基于 文本 数据 的 故事 线 构建 及 可 视 化 .情感 化 、 
场景 化 的 创新 型 研究 范式 。 


2 文献 回顾 


故事 线 缘起 于 2009 年 R，Munroe 开创 的 XKCD 
手绘 插图 “电影 叙事 ” ,漫画 通过 线条 叙述 方式 由 左 至 
右 展 示人 物 角 色 , 以 线条 的 靠近 或 偏离 代表 人 物 交互 
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会 话 的 开始 与 结束 " ,不 仅 能 显示 事件 在 时 间 上 的 先 
后 顺序 ,还 可 以 表示 事件 间 的 语义 关系 以 及 衍生 事件 ， 
直观 地 展示 事件 随时 间 发 展 和 传播 的 过 程 ”1。 

起 初 , 受 电影 漫画 研究 启发 ,故事 线 以 数字 叙事 或 
虚拟 叙事 ,交互 式 叙事 的 形式 出 现 "" ,国内 外 学 者 们 
致力 于 探寻 故事 线 组 成 要 素 。M. Bal 将 故事 线 元 素 划 
分 为 事件 .角色 时间、 地 点 以 及 其 他 (情节 .语气 、 观 
点 ) "1 ,T. Tan 等 在 Bal 分 类 基础 上 将 元 素 重组 为 角 
色 关系 ` 结 构 、 修 饰 ,情节 和 事件 五 类 1 , 余 玉 轩 等 认 
为 故事 线 可 视 作 日 期 时间、 机构 ` 人 物 ` 地 点 .主题 和 
关键 词 的 联合 概率 分 布 "1。 
伴随 研究 不 断 深入 发 展 ,故事 线 衍生 为 可 视 化 氢 
事 " ,数据 驱动 叙事 5 等 不 同 概念 形式 ,学 者 们 专注 
于 击 事 线 构建 方式 及 提升 故事 线条 美观 度 。 如 在 Lu- 
ce 吧 检 索 结果 集 上 构建 多 视点 图 ,随后 通过 寻找 最 小 
权重 支配 集 来 第 选 代表 性 数据 ,最 后 通过 求解 有 向 其 
增 给 村 问 题 生成 故事 线 "" ;或 基于 贝 叶 斯 网 络 无 监督 
控 虱 算法 实现 故事 线 自动 布局 "1; 亦 或 基于 小 传 算法 
(gepetic algorithm ,GA) 计 算 故 事 线 布局 策略 ,引入 “ 交 
耳 到 话 " 概念 ,应 用 初始 会 话 布局 .线条 优化 等 提升 故 
弄 线 爸 建 效果 ""。 同 时 , 因 GA 算法 所 属 人 工 智能 算 
湛 S 玫 而 布局 所 消耗 时 间 较 长 ,因此 需要 借助 平滑 算法 
请 油 线 的 几何 形状 "或 应 用 StoyFlow StoryCake、 
Ya LitStoryTeller、TimeNets 等 工具 或 工具 组 合 使 
及 四 来 优化 故事 线 旦 现形 态 ,从 而 使 故事 线条 更 加 


= 
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-三 受 数字 技术 影响 ,学 者 们 不 再 拘泥 于 探 咯 故事 线 
构 填 形态 ,而 是 希 费 深入 挖 所 要素 ,分解 要 素 ,使 其 精 
细 化 .碎片 化 ,进而 整合 要 素 .串联 要 素 ,实现 可 视 化 、 
情感 化 .场景 化 展示 。 相 关 研 究 主要 集中 在 计算 机 领 
域 ,如 通过 改进 单 源 最 短路 径 发 据 话 单数 据 ,以 Spark 
Graphx 和 Echarts 实现 相关 特征 和 人 物 关系 图 的 可 视 
化 。 利 用 视频 流 分 解 算法 .关键 帧 提取 算法 对 视频 
段 分解. 抽取 情节 ,实现 故事 主线 的 时 序 结构 展现 。 
同时 在 大 量 数据 梳理 及 挖掘 过 程 中 ,按照 数据 处 理 粒 
度 与 维度 不 同 ,抽取 情感 特征 语词 ,获取 情感 持 有 者 意 
见 2 ,掌握 情感 波动 轨迹 。 除 此 之 外 ,图 书 情报 领域 
岂 对 此 类 问题 展开 了 相关 研究 。 陈 博 等 基于 文本 挖 气 
技术 提取 《英雄 格 萨 尔 ) 主 题 特征 词 ,实现 故事 主题 可 
视 化 2 ;欧阳 剑 采用 可 视 化 分 析 方 法 对 大 规模 古籍 文 
本 进行 挖掘, 不断 改进 与 优化 应 用 场景 的 分 析 发 
现 ”。 作 为 一 种 流行 的 策划 、 组 织 和 个 人 叙事 的 方 
法 59 , 王 晰 冕 等 从 故事 线 .时 间 线 .情感 线 等 方面 对 社 


交 网 络 事件 进 行 知识 图 谱 可 视 化 分 析 ”1;X. M. Zou 
等 结合 社会 场景 和 主题 情境 梳理 微 博 故 事情 感 线 , 引 
入 话题 上 下 文 模拟 语义 关系 ;张海涛 等 根据 Louvain 
算法 划分 评论 网 络 群 落 ,动态 跟踪 热点 事件 网 民 话 题 
意见 并 抽取 情感 特征 词 ,实现 僵 情 故事 线 场景 化 与 情 
感化 。K. Mcdowell 认为 故事 线 是 通过 叙事 经 验 构 
成 的 ,并 定义 了 一 个 信息 框架 即 数据 信息 、 知 识 、 智 慧 
框架 (DIKW ) 以 展示 故事 线 和 故事 叙事 应 该 如 何 引发 
概念 范式 转变 。 

综 上 所 述 ,学 者 们 从 探寻 故事 线 要 素 , 过 渡 到 应 用 
相关 工具 算法 构建 故事 线 与 优化 故事 线形 态 , 再 到 罕 
探 要 素 的 呈现 。 然 而 在 现 有 研究 中 ,故事 线 要 素 展示 
较为 局 限 ,仅仅 围绕 1 个 (如 事件 ) .2 个 (如 情感 和 时 
间或 情感 和 事件 ) 要 素 展 开 研 讨 ,较为 侧重 事件 相似 性 
分 析 , 易 忽略 故事 线 完整 的 结构 化 表达 ,无 法 直观 洞察 
关联 要 素 ( 如 和 人物、 时间、 地 点 .事件 .情感 等 ) ,实现 多 
维 要 素 总 览 ,并 且 辐 射 范围 以 计算 机 通信 、 社 交 媒 体 、 
网 络 生 情 等 领域 为 主 , 鲜 从 历史 人 物 挖掘 视角 进行 探 
究 。 数 字 时 代 , 故 事 线 的 相关 研究 仍 处 于 不 断 探索 与 
发 展 阶段 。 在 数字 浪潮 推动 下 ,人 文 研究 者 们 琶 需 新 
的 技术 工具 和 人 文 逻 辑 相 耦合 的 新 研究 范式 ,亟待 技 
术 的 “ 生 鲜 注入 ” ,拓宽 故事 线 研究 视角 ,拓展 数字 人 
文 跨 域 空间 ,推动 实践 纵深 发 展 。 

因此 ,基于 数字 人 文 视角 ,本 文 将 “数字 技术 ” 髓 
入 “人 文 研究 ”, 以 《张学良 口述 历史 了》 文本 为 研究 对 
象 ,引入 LDA 主题 模型 与 SnowNLP 情感 词典 ,以 ju- 
pyter 为 实验 工具 ,借助 jieba 分 词 对 文本 进行 预 处理 ， 
识别 人 物 .地 点 事件. 时间、 情感 等 关联 要 素 , 构 建 多 
维 可 视 .情感 集成 的 张学良 故事 线 , 有 助 于 人 文学 者 读 
史学 史 \、 品 史 、 鉴 史 、 思 史 , 实 现 文本 挖 气 创 新 ,同时 提 
供 了 基于 文本 数据 的 故事 线 构建 及 可 视 化 ,情感 化 \ 场 
景 化 全 新 研究 范式 。 


3 ”研究 框架 及 研究 方法 


3.1 研究 框架 

历史 记载 最 常见 的 史料 形态 是 文本 ,伴随 数字 人 
文 时 代 到 来 口述" 形式 突破 了 文本 叙事 牢笼 ,铸就 
了 文本 图片 音频、 视频 等 多 元 并 包 的 新 业态 ,丰富 了 
历史 档案 研究 。 同 时 ,口述 历史 是 史料 呈现 最 直观 化 、 
写实 化 的 表示 ,能 以 颇具 生动 性 的 "口述 ”叙事 方式 补 

在 本 研究 中 ,首先 对 初始 数据 源 进行 预 处 理 , 获 取 
实验 数据 源 。 然 后 应 用 LDA 主题 识别 模型 获取 主题 
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凑 和 


~ . i 
以 《张学良 口述 历史 》 为 例 [J] Ih na 六 


分 布 ,进行 t-SNE 数据 降 维 并 呈现 主题 模块 ,同时 借助 
Python 类 下 SnowNLP 情感 词典 逐 行 对 文本 数据 进行 情 
感 挖掘, 将 情感 演化 过 程 子 以 可 视 化 呈现 ,以 此 为 基点 
梳理 张学良 故事 线 , 人 研究 框架 如 图 1 所 示 : 


初始 数据 源 : txt 
《张学良 口述 历史 》 
jieba 分 词 预 处理 ( 剔 除外 编 、 附 录 等 无 关 信 息 ) 
实验 数据 源 : txt 
《张学良 口述 历史 》 
| ¥ ! 
张 LDA 省 
SnowNLP ! 
主题 分 布 | 


Sklearn 


t-SNE 


主题 模块 


供 基于 文本 数据 的 故事 
构建 及 可 视 化 、 情 感化 、 场 景 化 研究 范式 


富 图 1 《张学良 口述 历史 》 故 事 线 构建 研究 框架 


3 研究 方法 
3 LDA 主题 模型 

ED 隐 含 狄 利 克 雷 分 布 (Latent Dirichlet Allocation ， 
LE 是 一 种 文档 主题 生成 模型 ,也 称 为 三 层 贝 叶 斯 概 
薄 稳 型 ,最 早 由 D，M，Blei 等 "提出 ,可 将 文档 词 向 
量 药 简 为 主题 时 空降 维 表达 ,在 处 理 文本 过 程 中 具备 
0 能 力 、 良 好 的 灵活 性 与 适应 性 ,具有 文 
术 控 气 与 聚 类 ,主题 划分 与 解析 等 多 样 化 功能 。 

全 本 研究 将 LDA 主题 建 模 方法 应 用 于 文本 内 容 抽 
取 GJ 实 现 文本 语义 层面 向 多 元 主题 空间 聚 类 过 渡 , 从 
而 重 助 相关 研究 者 挖掘 所 需 有 用 信息 ,实现 精准 感知 
与 智能 抽取 。 值 得 注意 的 是 ,在 主题 识别 过 程 中 ,LDA 
模型 主题 数目 将 影响 主题 识别 效果 空 -3 。 主 题 数目 


出 版 说明 
翻 开 中 国 当代 史 张学良 近 百年 来 影响 中 国 历史 进程 人 物 
过 去 一 百年 中 国 出 现 翻天 覆 地 变化 风云 人 物 涌现 真正 改变 中 国 发 展 轨迹 改写 


设置 过 多 ,会 造成 识别 出 的 主题 分 布 过 于 稀 玻 ,主题 相 
似 度 过 高 ;主题 数目 设置 过 少 ,会 导致 主题 过 于 宽泛 ， 
无 法 准确 揭示 文本 核心 内 容 ” 。 而 困惑 度 
ty) 可 以 用 来 确定 合适 的 主题 数目 ,度量 概率 分 布 或 概 
率 预测 样本 的 好 坏 程度 。 
3.2.2 ”SnowNLP 情感 词典 

文本 情感 分 析 (text sentiment analysis ) 又 称 为 意见 
挖掘 ,是 对 带 有 情感 色彩 的 主观 性 文本 进行 分 析 、 人 处 理 、 
归纳 和 推理 ”。 按 照 文 本 粒度 , 可 分 为 词语 级 、 短 语 
级 .语句 级 .篇章 级 以 及 多 篇 章 级 等 研究 梯次 ” 。 目 前 ， 
常见 的 文本 情感 分 析 有 两 种 路 径 : 基于 情感 词典 和 基于 
机 需 学 习 。 本 研究 采用 基于 python 的 SnowNLP 情感 词 
典 分 析 方 法 , 自 带 训练 好 的 基础 情感 词典 和 自 建 词典 。 

鉴于 在 实际 操作 过 程 中 ,情感 词典 的 完备 性 会 直 
接 影响 情感 特征 词 的 提取 效果 ,并 进一步 影响 最 终 的 
实验 结果 。 因 此 ,在 实验 前 ,笔者 首先 通过 抽取 部 分 文 
本 数据 导入 基础 情感 词典 测试 ,发 现 情感 语词 结果 所 

属 类 别 较为 规范 ,准确 性 较 高 ,实验 效果 良好 。 如 "不 

大 正直 “非常 艰苦 “不 喜欢 “ 太 不 争气 "等 所 属 * 消 
极 ”， 聪 明 “ 很 好 “漂亮 “年 轻 ” 等 所 属 " 积极 ”, 故 
而 经 测试 后 ,无 需 自 建 词典 ,选取 基础 情感 词典 即 可 。 


4 数据 采集 和 处 理 


4.1 数据 来 源 及 预 处 理 

本 文 候 梳 西安 事变 数据 库 《 张学良 口述 历史 》 文 
本 作为 初始 数据 源 (txt)“” , 剔除 外 编 . 附 录 等 无 关 信 
息 后 进行 jieba 分 词 处 理 ,实验 工 具 为 jupyter notebook。 
部 分 分 词 结果 如 图 2 所 示 。 由 此 获取 实验 数据 源 , 以 
unicode utf-8 编码 ,txt 格式 保存 ,为 梳理 张学良 故事 线 
脉络 提供 可 靠 数 据 支 撑 。 


( perplexi- 


国 历 史 人 物 a: 张学良 先后 两 度 历史 关键 时 刻 国家 统一 抗日 救亡 大 是 大 非 问题 


张学良 有 着 传奇 一 生 活动 多 次 改变 历史 方向 皇 姑 屯 


事变 后 不 久 张学良 宣布 东北 易帜 统一 


变 促使 蒋介石 抗日 掀起 光辉 灿烂 一 页 张学良 杨虎城 将 军马 


张学良 将 军 2001 年 10 月 14 日 美国 夏威夷 与世长辞 享年 101 岁 时 人 
张学良 口述 历史 系 缘 于 哥 伦 的 [大 学 哲学 教授 史学 家 唐 德 刚 
张学良 看 唐 德 刚 撰写 李宗仁 回忆 录 后 派 人 找到 唐 德 刚 先生 

唐 德 刚 eic 地 说 海外 华商 史学 工作 者 眼底 手头 见 琳琅 满目 
张学良 将 军 辞世 后 唐 德 刚 先生 助手 帮助 下 历经 数 年 ”精心 整理 
该 书 出 版 大 众 读 者 历史 研究 者 很 强 现实 意义 历史 意义 

张学良 自述 是 是 非 非 代 序 


六 
击 


中 共 中 央 总 书记 
情 士 1990 年 1 月 5 月 间 台北 
说 张学良 想 请 吃饭 那 次 宴会 张学良 表示 想 请 唐 为 写 


家 主席 江泽民 发 去 哮 电 高 度 评价 张学良 历史 功绩 誉 其 为 中 华 民 族 干 古 功臣 了 


投 张学良 寓所 亚 饭店 先后 录 下 11 和 | 标注 录音 时 间 分 别 
回忆 录 成 全 部 预定 工作 唐 德 F 


后 来 种 种 原 
中 华 无 价 之 宝 眼睁睁 看 着 逐渐 流失 内 心 发 生 沉重 使 命 感 遗 恨 忱 惜 之 情 Ey BE 为 力 心理 孤独 之 感 真 
录音 资料 成 本 书 全 书 张学良 自述 内 容 再 现 张学良 精彩 绝伦 一 生 作者 忠实 张学良 自述 历史 记述 全 部 


图 2 《张学良 口述 历史 了》 文本 jieba 分 词 部 分 展示 


4.2 结果 分 析 
4.2.1 主题 模型 可 视 化 

文本 主题 可 视 化 表示 是 指 把 文本 知识 转化 为 用 图 
形 图像 或 动画 表示 的 知识 ,其 目的 在 于 让 人 直观 地 观 
察 到 核心 信息 和 关键 数据 ,从 而 快速 发 现 其 中 蕴含 的 


点 上 主题 的 分 布 ,以 及 多 个 主题 随时 间 的 发 展 变 化 。 


LDA 模型 采用 词 袋 (bag of words ) 方 法 ,将 每 一 篇 文档 
视 为 一 个 词 频 向 量 ,从 而 将 文本 信息 转化 为 易于 建 模 
的 数字 信息 ,简化 了 主题 分 析 的 复杂 性 。 每 一 篇 文档 


代表 了 一 些 主题 所 构成 的 一 个 概率 分 布 ,而 每 一 


深层 知识 。 透 过 主题 模块 ,用 户 可 以 看 出 特定 时 间 


题 又 代表 了 很 多 单词 所 构成 的 一 个 概率 分 布 。 
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(1)LDA 主题 模型 识别 。 本 文 将 jieba 分 词 后 的 
txt 文本 存储 读 取 语 料 ,通常 每 一 行文 本 可 视 作 一 篇 文 
档 ,生成 Doc0-Doc1015 ,共计 1 016 条 文本 。 此 时 文本 


度 作 为 衡量 本 研究 中 《张学良 口述 历史 》 文 本 主题 数 
目 划分 是 否 科学 的 依据 。 通 常 来 说 , 低 困 惑 度 能 更 好 
地 预测 样本 主题 数目 , 即 困惑 度 越 低 , 聚 类 效果 越 好 。 


的 词语 转换 为 词 频 矩阵 ,矩阵 元 素 a[ i][j] 表示 j 词 在 
i 类 文本 下 的 词 频 ,根据 词 频 矩 阵 ,应 用 LDA 算法 ,和 迭 
代 500 次 ,提取 关键 特征 ,进一步 获取 文档 主题 分 布 ， 
输出 主题 中 的 TopN 关键 词 .主题 个 数 。 同 时 ,以 困惑 


困惑 度 值 如 图 3 所 示 ,主题 数目 为 5 时 ,困惑 度 达 到 最 
低 值 。 因 此 ,《 张 学 良 口述 历史 》 文 本 主题 划分 数目 是 
5 时 聚 类 效果 最 佳 。 
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GN 本 文 依据 主题 数目 ,进一步 提取 主题 关键 词 归 类 ， 
进行 分 词 抽取 。 该 文本 主题 (Topic) 共计 5 个 ,以 Top- 
id03Topic4 分 布 ,结合 主题 分 布 结果 和 《张学良 口述 历 

本 信息 ,概括 主题 如 下 : 即 Topic0 身世 背景 ; 

从 丧家 发 迹 入手 , 主要 介绍 了 张学良 祖母 ,爷爷 奶奶 ， 
父 寻 ,兄弟 姐妹 ,姑姑 姑父 ,二 伯父 等 家 世 背 景 。Top- 
ie 名 一 女人 韵事 : 主要 讲述 张学良 与 妻子 于 凤 至 、 谷 
瑞 玉 、 赵 一 获 ( 赵 四 ) ,以 及 梁 九 、 墨 索 里 尼 小 姐 ( 墨 索 
里 尼 的 女儿 ) 等 众多 女性 朋友 的 情感 纠葛 。Top- 
ic2 一 一 幼 青 时 代 : 即 描述 张学良 与 张作霖 的 父子 之 情 
以 及 张学良 初 人 讲 武 堂 弃 文 从 军 之 事 。Topic3 
帅 之 路 :以 叙述 张学良 带 兵 之 道 为 背景 ,围绕 吴佩孚 、 
郭 松 龄 .冯玉祥 等 人 展开 叙事 ,以 东北 易帜 、 热 河 失守 、 
皇 姑 屯 等 东北 往事 为 主线 展开 ,涉及 第 一 次 直 奉 战争 、 
第 二 次 直 奉 战争 .南口 军纪 案 等 。Topic4 一 一 晚年 生 
活 : 以 张学良 晚年 生活 为 主 , 如 子孙 现状 、 个 人 喜好 等 。 
与 此 同时 ,调用 matplotlib. pyplot 输出 文档 对 应 的 
主题 分 布 图 。 笔者 随机 抽取 文档 Doc25、Doc166、 
Doc288 、Doc324 、Doc501 、Doc700 ,查看 并 验证 文本 所 
属 主题 领域 ,如 图 4 所 示 。 由 此 可 见 ,Doc25 所 属 Top- 
ic2 ;Doc166 分 布 于 Topicl 和 Topic3 ;Doc288 所 属 Top- 


少 


Topic Number 


3 《张学良 口述 历史 》 文 本 主题 划分 困惑 度 值 


ic0 和 Topic3 ; Doc324 分 布 于 Topic2 和 Topic4, Doc501 
所 属 Topic3 和 Topic4 ;Doc700 分 布 于 Topic4 。 
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图 4 随机 文档 所 属 主题 分 布 


(2)t-SNE 降 维 。 在 高 维 数据 中 ,通常 用 多 特征 表 
示 一 个 数据 点 ,这 不 仅 为 数据 描述 和 分 析 带 来 诸多 困 
难 ,同时 也 会 增 大 该 数据 点 的 计算 难度 和 计算 所 需 空 
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i 


以 《张学良 口述 历史 ) 为 例 [] 国 此 忆 字 E, 因 江 旭 


间 和 时 间 。 因 此 ,为 避免 数据 训练 时 间 过 长 ,为 使 上 述 
主题 模块 更 为 清晰 呈现 ,提升 数据 可 视 化 效果 ,本 研究 
采用 t-SNE 降 维 。 

t-SNE(t - 分 布 式 随机 邻 域 息 入 ) 作为 挖掘 高 维 数 
据 的 非 线性 降 维 算法 ,通过 多 特征 数据 点 的 相似 性 
来 识别 .观察 ,进一步 发 现 数据 规律 ,实现 多 维 数据 向 
2 维 或 3 维 空间 映射 。 经 t-SNE 降 维 后 ,Topic0-Topic4 


为 消极 ,表示 情感 倾向 负面 情绪 。 就 张学良 而 言 ,其 
感 线 历 经 情感 积极 期 一 情感 中 立 期 一 情感 消极 期 一 
感 平淡 期 4 个 阶段 。 

前 400 条 文本 信息 sentiment 接近 1, 所 属 情感 积 
极 期 ,以 “ 联 莫 "“ 一 表 人 才 ”“ 漂 亮 “ 阔 气 “ 赞 成 “很 
好 ”非常 高 兴 "“ 得 意 “ 愿 意 ”“ 贤 妻良 母 ”“ 因 爱 "“ 非 
常言 欢 ”等 情感 语词 为 主 , 该 阶段 故事 线 以 张学良 身世 


ZT Tt 


以 团 复 形式 呈现 ,5 个 主题 (Topic0-Topic4) 以 0 -4 标 


5  t-SNE 主题 模块 


4 人 2 情感 态度 可 视 化 表示 

入 情感 态度 可 视 化 表示 是 指 以 图 信息 呈现 文本 蕴含 
和 需 感 态度 ,实现 情感 走向 的 可 视 化 映射 。 文 本 除了 包 
舍 定 题 , 观 点 和 结构 之 外 ,还 蕴含 肯定 ,否定 .喜爱 .大 
恶 < 针 赏 批评 等 情感 态度 信息 ""。 伴 随 事 态 发 展 ,口述 
者 通常 在 不 同时 期 会 发 生 情感 波动 , 即 情感 变化 ,因而 ， 
抽 耻 情感 特征 词 进行 情感 极 性 分 析 , 绘 制 动 态 变化 的 情 
感 演化 图 谱 , 能 直观 呈现 张学良 在 各 个 时 期 的 情感 动态 
演 做 。 选 择 SnowNLP 基础 情感 词典 对 实验 数据 源 进行 
情感 分 析 , 加 载 sentiment 情感 分 析 模 块 对 语料库 进行 训 
练 ,同时 调用 matplotlib 输出 情感 波动 结果 ,如 图 6 所 示 : 
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6 张学良 情感 波动 图 示例 
从 图 6 看 出 ,每 一 条 文本 信息 的 sentiment 取 值 以 
线条 接近 取 值 边框 距离 为 基准 ,sentiment 取 值 接近 1 
为 积极 ,表示 情感 倾向 正面 情绪 ;sentiment 取 值 接近 0 


背景 父子 关系 、 求 学 经 历 、 婚 姻 故 事 为 主线 展开 ; 
400 -800 条 文本 信息 sentiment 介 于 0 和 1 之 间 , 所 属 
情感 中 性 期 ,主要 情感 语词 涉及 “说 不 定 ”“ 复 杂 ”“ 奇 
怪 ”"“ 差 不 多 ”"“ 侈 不 得 “路 足 " 等 ,该 阶段 故事 线 以 战 
争 背 景 为 主旋律 , 旦 涵盖 第 一 、 二 次 直 奉 战争 ,北京 政 
变 。 既 富 含 浓烈 的 爱国 主义 情怀 ,又 饱含 对 叛变 倒戈 
之 人 的 愤怒 ;800 -1 400 条 文本 信息 sentiment 接近 0 ， 
所 属 情感 消极 期 , 量 消 极 语词 密度 略 显 密集 ,以 “ 恨 透 
了 ”性 悔 "“ 自 责 ”"“ 痛 苗 "“ 大 烦 ”“ 悲 愤 "“ 谨 责 "“ 闫 
辱 ”“ 难 过 "等 情感 语词 为 代表 ,该 阶段 以 内 战 “ 九 一 
八 
有 


"事变 “西安 "事变 等 重大 转折 性 历史 事件 为 主 , 既 

失去 国土 领地 的 心痛 ,又 有 国共 内 战 的 厌倦 之 情 , 同 
时 又 兼 有 遭受 " 慎 悔 录 " 风波 的 误解 与 迷惑 。1 400 条 
文本 信息 所 属 情感 平淡 期 ,此 段 经 历 主要 介绍 张学良 
晚年 生活 , 偶 有 消极 情感 波动 。 
4.3 ”张学良 故事 线 可 视 化 、 情 感化 场景 化 呈现 

故事 线 旨 在 将 繁琐 复杂 的 数据 进行 图 标 化 的 整 
合 , 从 提炼 分 析出 的 数据 组 织 故事 ” ,由 关联 要 素 ( 人 
物 .事件 时间、 地 点 ,情感 等 ) 组 建 ,关联 要 素 亦 可 称 之 
为 故事 单元 (story unit) ,每 个 故事 单元 又 是 发 生 在 某 
个 特定 的 场景 中 ,而 单个 故事 单元 仅 能 反映 故事 线 
的 单一 层面 ,无 法 揭示 故事 线 完整 全 貌 。 故 而 ,本 文 试 
图 将 零散 的 故事 单元 有 机 集成 ,通过 汇集 诸多 故事 单 
元 完善 张学良 故事 线 完 整 表达 。 
故事 线 可 视 化 即 重组 展示 数据 形态 ,为 进一步 场 

景 化 建构 提供 必要 基础 。 故 事 线 情感 化 即将 情感 线条 
渗入 故事 情境 ,进而 丰富 场景 丰 聚 度 。 故 事 线 场景 化 
即 由 粗 粒度 过 渡 到 细 粒 度 的 组 织 过 程 ,塑造 人 、 事 、 地 、 
时 情感 等 要 素 的 “集合 圈 ”。 可 视 化 、 情 感化、 场景 化 
相互 交织 互 促 以 完善 张学良 故事 线条 ,成 为 推动 叙事 
内 容 更 加 丰富 的 重要 手段 。 
基于 前 述 主题 模块 分 布 及 情感 线 梳理 ,笔者 在 ju- 
pyter 实验 工具 中 读 取 人 物 要 素 .事件 要 素 、 时 间 要 素 、 
地 点 要 素 ,并 以 时 间 线 为 横 轴 ,串联 附加 情感 演化 各 个 
时 期 ,同时 读 取 文本 大 事 年 表 , 对 张学良 故事 线 发 展 脉 
络 进行 梳理 ,如 图 7 所 示 : 


21 


图 襄 情 荫 三 作 


第 66 卷 第 7 期 2022 年 4 月 


ChinaXiv 合 作 期 刊 


三 第 二 次 直 奉 战争 


一 冯玉祥 发 动 北京 政变 


956 1985111——— 193418 (io) ono 一 一 1930 


| 呈 


1926 ® > 
原 大 沪 攻守 虹 外 天 pig 吉 任 。 张 作家 在 北京 成 | 张 学 和 进 帮 上 部 检 从 反 素 
人 妆 作 要 请 袜 | 六 未 从 玉 | 部 松 的 反 奉 


/ 西安 事变 党 yh 

上 人 中 央 党 部 张学良 欧 洲 考察 上 热 河 抗战 ”| 九 一 人 事 到 

/ 张学良 送 将 介 石 |、 0 

| L 张 学 了 Ti 些 自 、 学 表 | i Re 

| 识 计 将 尖 过 是 “本 广 半 六 局 台 电 -沈阳 失守 计件 [村 人 南口 军纪 案 - 郭 松 龄 兵 败 被 杀 
由 上 海 携 家 着 

1 出 国 考察 
| (OneDN Wood0s 0000 so 00nd nn mrssonntd drendonunbadddonounte bade mo merobomeorion) 平淡 期 Mobdodr dons Dooddrn ord un nde nnn nr nn tdion btn mneb no 


~ © 全 196474 


® 


一 一 全 一 于 一 一 一 0 
重 苏 齿 良 赴 美 国 一 获 仙 | 剖 
二 颖 党 眉 吕 天 人 C2 莫不 交代 痢 ， 张学良 逝世 ,享年 101 岁 


环 关 良 九 十 张学良 返回 台北 上 


7 ”张学良 故事 线 及 可 视 化 、 情 感化 、 场 景 化 呈现 
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忆 总 体 而 言 , 果 焦 "人 "的 帮 事 维度 。 张学良 故事 线 


大 量 以 人 物 为 中 心 的 叙事 素材 ,如 赵 氏 .于 凤 至 、 
;SB 祷 将 介 石 . 杨 宇 霆 .汪精卫 等 ,这 些 人 物 是 深入 了 
能 学 良 的 重要 窗口 聚焦 * 事 "的 故事 维度 。 事 件 
丰田 于 进一步 回溯 揭示 真相 ,还 原 史实 内 容 。 聚 焦 
“全 的 故事 维度 。 地 点 凸显 着 地 域 布局 变化 ,彰显 着 
地 找 形 态 迁 移 之 势 , 有 利于 探究 人 物 移动 轨迹 。 聚 焦 
“全 名 的 故事 维度 。 以 时 间 轴 将 时 间 节 点 联结 ,清晰 可 
见 张学良 一 生 的 时 间 跨 度 ,有 助 于 准确 .详实 地 把 握 人 
物 年 平 脉络 。 

〇 细 化 而 言 , 从 图 7 可 以 看 出 ,1901 - 1924 年 展示 了 
张学良 情感 演化 两 个 阶段 。 情 感 积极 期 着 眼 于 张学良 
少时 的 成 长 经 历 ,涵盖 4 个 时 间 切片 :1901 年 .1911 
年 .1916 年 和 1919 年 。 人 物 涉及 其 生母 赵 氏 ,妻子 于 
风 至 ;情感 中 立 期 包含 1922 年 和 1924 年 两 个 时 间 切 
片 , 记 载 了 第 一 次 .第 二 次 直 奉 战争 ,涉及 的 人 物 是 冯 
玉 祥 。1925 - 1936 年 囊括 了 11 个 时 间 切 片 ,涉及 的 人 
物 有 汪精卫 .蒋介石 . 杨 宇 霆 . 郭 松 龄 .张作霖 .冯玉祥 ， 
呈现 了 “西安 "事变 .中 央 党 部 事件 . 热 河 抗 战 “ 九 一 
八 "事变 . 皇 姑 瑟 事件 .中 原 大 战 等 事件 ,此 阶段 张学良 
情感 呈现 消极 状态 。 情 感 平淡 期 (1946 - 2001 年 ) 以 
张学良 晚年 生活 为 主线 ,包含 10 个 时 间 切片 。 以 1991 
年 为 例 , 该 时 间 节点 记录 了 张学良 携 夫 人 赴 美国 探 过 
访 友 ,而 后 返回 台北 ,展示 了 地 点 变化 。 
由 此 可 见 , 透 过 线条 梳理 ,清晰 可 见 张学良 完整 故 
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世 ) ,包含 与 之 关联 的 人 物 .事件 ,地 点 .时间 ,同时 予以 
情感 演化 各 阶段 呈现 ,促进 了 文本 单一 记事 转向 多 维 
握 事 ,实现 了 关联 要 素 可 视 化 情感 化 ,场景 化 动态 
互 促 。 


5 讨论 与 启示 


传统 的 文本 叙事 需要 借助 人 工 方式 手动 抽取 相关 
知识 内 容 。 而 数字 人 文 背 景 下 ,数字 技术 的 加 持 能 拓 
展 文本 范 型 的 记事 表现 力 , 切 实 解决 传统 人 工 模式 难 
以 快速 捕捉 关联 知识 的 困 男 ,彰显 数字 人 文 视 野 下 的 
巨 观 数 据 计算 优势 ,展现 知识 要 素 从 文本 记事 向 多 维 
叙事 场 域 迁 移 ,实现 数字 人 研究 与 人 机 共 读 ,凸显 “ 数 
字 ” 与 人文 "内核 。 
5.1 从 文本 史料 到 故事 多 维 呈现 

传统 物理 媒介 是 静态 的 .被动 的 ,而 数字 媒介 则 是 
动态 的 能动 的 。 故 事 线 的 表现 形式 使 得 人 文 研 究 不 
仅仅 显现 于 文本 史料 表象 ,而 是 透 过 “线条 ”较为 精细 
化 、 细 粒度 描绘 ,成 功 将 与 张学良 关联 的 人 物 \ 时 间 、 事 
件 .地 点 ,情感 等 文本 信息 与 引人入胜 的 故事 情节 串 
联 , 将 过 往 历史 予以 揭示 ,辅助 人 文学 者 提炼 与 挖掘 生 
动 有 趣 的 故事 素材 ,快速 定位 查找 史料 对 应 的 “关联 数 
据 " 继 而 进一步 理 顺 历史 “脉络 ”。 同 时 , 因 “ 口 述 ” 研 
究 是 从 原始 史料 中 提取 故事 要 素 , 展 现 了 知识 素材 的 
原始 状态 ,故而 从 计算 软件 中 提取 丰富 多 元 的 人 物 信 
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息 .逻辑 清晰 的 故事 线索 .跌宕 有 致 的 事件 过 程 创设 故 
事 线 ,不 仅 实 现 了 文本 信息 传递 与 “ 活 态 "史料 互动 ， 
而 且 通 过 穿插 在 历史 叙事 中 的 语义 描述 ,激发 了 人 文 
学 者 进行 深层 次 知识 发 现 .知识 迁移 .知识 挖掘 与 知识 
创新 。 
5.2 ”从 文本 表达 到 视觉 可 视 化 表征 

故事 线条 的 生动 展现 实现 了 文本 “知识 表示 ”向 
可 视 化 “知识 单元 "过 渡 , 避 兔 了 史料 潜藏 于 传统 书籍 
的 叙述 ,将 零散 杂乱 .可 读 欠 佳 ,检索 不 便 的 口述 历史 
文本 集 汇 , 经 数字 技术 解构 .重组 、 重 构 后 更 易于 梳理 、 
理解 与 应 用 ,催生 了 极 具 冲 击 力 与 感染 力 的 活 态 数据 
可 视 化 集成 。 一 方面 ,通过 “ 引 介 ” 故 事 线 拓宽 了 文本 
知识 表示 的 可 视 化 路 径 ; 另 一 方面 ,注入 新 技术 方法 抽 
取 关 联 信息 ,集聚 了 可 视 化 要 素 特征 ,如 主题 识别 .时 
清 韶 列 分 析 、 人 物 关系 探索 ,以 此 来 进行 事件 史实 揭示 
与 兽 释 .历史 发 展 规律 与 趋势 解读 等 ,加 速 文本 数据 向 
变 事 线 图 谱 肾 类 表示 的 知识 场 域 迁 移 。 同 时 ,故事 线 
条 于 视 化 视觉 表征 除了 传达 文本 事实 ,其 目标 还 在 于 
传 给 态度 ,期望 .见解 等 ,并 以 此 匡 扶 人 文 研究 者 正确 
包罗, 重组 .思辩 知识, 藉 由 可 视 化 故事 线条 “关联 数 
据 习 构筑 知识 关联 网 系 。 
5'SN 从 文本 语词 到 情感 场 域 集 江 
之 情 感 分 析 对 于 透析 人 物 属性 至 关 重 要 。 情 感 多 源 
- 观 实 生活 ,故而 以 情感 语词 作为 情感 判别 依据 ,有 助 
于 瞎 实 还 原 人 物 形象 ,将 情感 演化 过 程 融入 故事 线 , 有 
助 宇 厘清 张学良 伴随 事态 变迁 的 情感 极 性 与 心路 历 
程 名 我 们 应 当 注 意 到 ,在 张学良 情感 动态 演化 过 程 中 ， 
当 情 感 伴随 故事 发 展 产生 波动 时 ,有 时 不 仅仅 表现 为 
单一 情感 作用 ,而 是 多 元 情感 交错 互 替 。 张 学 良 在 不 
同时 期 不 同 阶段 的 经 历 致使 其 情感 极 具 波 动 性 ,衍生 
出 积极 期 一 中 立 期 一 消极 期 一 平淡 期 4 个 阶段 , 既 折 
射出 张学良 浓烈 的 爱国 主义 情怀 ,收复 东北 ` 匡 复 河山 
的 雄心 壮志 ,又 凸显 其 深 感 已 力 和 国力 不 足 的 遗 司 , 无 
法 报国 恨 家 仇 的 愤慨 以 及 “ 仇 日 情结 "的 不 断 升级 , 同 
时 还 伴 有 “ 尾 悔 录 ” 风波 的 疑惑 ,以 及 晚年 处 事 的 淡然 
安逸 等 ,多 元 情感 共同 集 汇 于 情感 场 域 ,贯穿 张学良 整 
个 故事 线 始终 。 
5.4 ”从 文本 叙事 到 场景 重 构 

以 “线条 ”清晰 描绘 故事 脉络 ,而 非 以 传统 人 工 手 
动 逐 页 浏览 阅读 书籍 ,突破 了 扁平 化 的 单调 文字 叙述 ， 
让 数据 表现 形式 更 加 * 鲜 活 ” ,实现 了 从 文本 叙事 到 数 
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据 解析 ,再 到 多 维 场景 重 构 。 透 过 故事 线 ,能 清晰 可 见 
与 张学良 关联 的 人 物 ( 赵 氏 ,张作霖 .于 凤 至 、 赵 一 获 、 
郭 松 龄 .冯玉祥 ` 杨 宇 霆 蒋介石、 汪精卫 等 ) 事件 (第 
一 次 直 奉 战争 .第 二 次 直 奉 战争 “ 九 一 八 ”" 事 变 “ 西 
安 " 事 变 等 ) ,地 点 (北京 .西安 等 ) \ 时 间 序 列 (1901.6. 
3、1911.4、1916 等 ) 情感 演 化 时 期 (积极 一 中 立 一 消 
极 一 平淡 ) 等 。 


6 结论 与 展望 
通过 抽取 机 读 后 可 识别 的 知识 要 素 构筑 张学良 故 


事 线 , 实 现 了 化 繁 为 简 ,铸就 了 更 加 清晰 直观 的 人 一 
事 一 地 一 时 一 情感 一 体 化 故事 线 脉络 体系 。 理 论 层 


面 ,本 文 为 人 文 领域 人 物 脉络 梳理 故事 线 构建 及 可 视 
化 .情感 化 .场景 化 实现 创新 了 研究 范式 ,丰富 了 框架 
构想 。 实 践 层面 ,以 《张学良 口述 历史 》 文 本 为 数据 源 
进行 应 用 探索 ,为 进一步 剖析 张学良 传奇 人 生 提 供 了 
一 定 指导 。 同 时 , 透 过 故事 线条 视觉 表征 ,提供 了 交互 
式 历史 数据 展示 ,可 辅助 人 文 研究 者 快 读 、 远 读 ,迅速 
捕获 张学良 一 生 重 要 时 间 点 、 重 要 事件 .主要 地 点 、 关 
联 人 物 以 及 情感 演化 变化 ,有 利于 进一步 洞察 与 深入 
挖掘 新 问题 ,拓宽 知识 研究 视野 ,推动 知识 价值 增益 ， 
助力 “数字 "与 "人文 " 互 融 共 生 。 
本 文 在 研究 过 程 中 仍然 存在 一 定局 限 性 。 如 对 
《张学良 口述 历史 》 文 本 的 主题 内 容 可 视 化 呈现 仅 采 
用 LDA 单一 算法 ,主题 方法 的 选择 以 及 是 否 可 以 应 用 
多 元 算法 更 加 全 面 化 、 细 粒度 与 精准 化 提取 知识 要 素 ， 
选择 不 同情 感 词典 进行 情感 分 析 , 使 数据 维度 不 再 局 
限于 扁平 化 处 理 , 实 现 图 谱 聚 类 3D 多 样 化 .地 理 时 空 
化 .VRAARAMR 虚拟 化 等 在 未 来 研究 中 可 进一步 探索 
与 补充 。 相 信 未 来 “数字 ”与 “人 文 " 的 互 促 与 融合 会 
更 加 生动 有 趣 , 数 字 技 术 的 助力 也 必 将 加 速 人 文 知识 
开掘 。 
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以 (张学良 口述 历史 ) 为 例 [J]C 基 由 网 


王 阮 , 邓 君 . 故事 线 构建 及 可 视 化 、 情 感化 场景 化 应 用 探索 
人 


Storyline Construction and Application Exploration of Visualization, Emotion and Scene : 
Taking Zhang Xreliazg sy Oral History as an Example 
Wang Ruan Deng Jun 
School of Business and Management, Jilin University, Changchun 130012 
Abstract: | Purpose/ Significance | Combing the historical facts with storyline not only has a certain theoretical 
and practical guidance and significance for describing and grasping the direction of historical development, but also 
provides a new technology realization mode and innovative research perspective for knowledge discovery in the human- 
ities field. | Method/Process | This study provided a research paradigm of storyline construction and visualization, 
emotion and scene based on text data, and made empirical exploration by combing the text of Zhang Xueliang’ s Oral 
History as the data source. This paper eused jieba word segmentation to clean the initial data source of Zhang Xueli- 
ang’”s Oral History to obtain experimental data source. LDA topic model was used to obtain topic distribution and t- 
SNE data dimension reduction was performed to present topic module. With the help of SnowNLP emotion dictionary, 
Temotional feature words were mined, Zhang Xueliang’ s emotional evolution stage was sorted out, and the storyline 
s constructed. | Result/ Conclusion | Through the construction of Zhang Xueliang’ s storyline, the dynamic mutual 


Promotion of multi-dimensional elements such as characters, places, events, time and emotions is realized. 


CO Keywords: storyline visualization emotion scene Zhang Xueliang 
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中 国 科 学 院 科研 道德 委员 会 办 公 室 发 布 关 于 规范 学 术 论 著 署 名 问题 负面 行为 清单 的 通知 


) 近日 ,中 国 科学 院 科研 道德 委员 会 办 公 室 发 布 (关于 规范 学 术 论著 署名 问题 负面 行为 清单 的 通知 》( 科 发 监 审 
= 函 字 [2022]1 号 ) ,对 中 国 科学 院 学 术 论 著 署名 问题 进行 了 规范 要 求 ,并 列 出 了 学 术 论 著 署 名 问题 的 负面 行为 
一 清单 。 
一 通知 指出 ,科研 诚信 是 科技 创新 的 基石 。 维 护 科研 诚信 、 开 展 负 责任 创新 ,既是 中 国 科 学 院 科 研 人 员 从 事 科学 
研究 推进 科技 创新 的 基本 原则 ,也 是 其 作为 国家 战略 科技 力量 主力 军 定位 的 基本 要 求 。 学 术 论著 署名 规范 一 般 
由 学 术 界 长 期 形成 的 惯例 自行 确定 ,根据 学 科 、 领 域 甚至 不 同 的 科技 期 刊 均 可 能 有 不 同 的 规范 要 求 。 制 定 出 适用 
于 不 同 场 景 的 统一 署名 规范 较为 困难 。 通 知 列 出 了 部 分 学 术 论 著 署名 问题 的 负面 行为 清单 ,如 冒 用 作者 署名 、 虚 
构 作 者 署名 ;无 实质 性 贡献 的 人 员 参 与 署名 ;未 经 所 有 作者 一 致 同 意 就 确定 署名 顺序 ;违反 署名 第 一 作者 或 通讯 作 
者 时 的 必要 性 原则 而 罗列 过 多 的 第 一 作者 或 通讯 作者 ; 因 作者 所 属 机 构 变 化 而 随意 变更 论著 工作 主要 完成 机 构 ; 
虚构 .伪造 作者 所 属 机 构 ;把 论著 非 完 成 机 构 作 为 署名 单位 ;使 用 非 正式 联系 方式 作为 论著 作者 的 联系 方式 ;故意 
排斥 有 重要 贡献 的 科研 工作 者 参与 署名 ;侵害 直接 实施 科学 实验 的 研究 生 的 基本 署名 权 等 。 

中 国 科 学 院 对 清单 所 列 行为 实施 “ 零 容忍 "要 求 , 要 求 凡 中 国 科学 院 科研 人 员 出 现 清单 所 列 行为 ,将 由 相应 第 
一 责任 单位 按照 通知 的 相关 规定 开展 调查 ,并 根据 具体 事实 和 相关 情节 予以 认定 和 处 理 ,对 严重 违背 科研 诚信 要 
求 的 行为 终身 追 责 。 
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